1. Принципы гипертекстовой разметки. Структура документов

За основу модели разметки документов в HTML принята тэговая модель. Тэговая модель описывает документ как совокупность контейнеров, каждый из которых начинается и заканчивается тэгами. Т.е. документ НТМL представляет собой не что иное, как обычный АSСII-файл, с добавленными в него управляющими НТМL-кодами (тэгами).

Тэги НТМL-документов в большинстве своем просты для понимания и использования, ибо они образованы с помощью общеупотребительных слов английского языка, понятных сокращений и обозначений. НТМL-тэг состоит из имени, за которым может следовать необязательный список атрибутов тэга. Текст тэга заключается в угловые скобки (< и >). Простейший вариант тэга - имя, заключенное в угловые скобки, например <HEAD> или <i>. Для более сложных тэгов характерно различие атрибутов, которые могут иметь конкретные значения, определенные автором для видоизменения функции тэга.

Атрибуты тэга следуют за именем и отделяются друг от друга одним или несколькими знаками табуляции, пробелами или символами возврата к началу строки. Порядок записи атрибутов в тэге значения не имеет. Значение атрибута, если таковое имеется, следует за знаком равенства, стоящим после имени атрибута. Если значение атрибута - одно слово или число, то его можно просто указать после знака равенства, не выделяя дополнительно. Все остальные значения необходимо заключать в одинарные или двойные кавычки, особенно если они содержат несколько разделенных пробелами слов. Длина значения атрибута ограничена 1024 символами. Регистр символов в именах тэгов и атрибутов не учитывается, чего нельзя сказать о значениях атрибутов. Например, особенно важно использовать нужный регистр при вводе URL других документов в качестве значения атрибута HREF.

Чаще всего НТМL-тэги состоят из начального и конечного компонентов, между которыми размещаются текст и другие элементы документа. Имя конечного тэга идентично имени начального, но перед именем конечного тэга ставится косая черта (/) (например, для тэга стиля шрифта - курсив <i> закрывающая пара представляет собой </i>, для тэга заголовка <ТIТLЕ> закрывающей парой будет </ТIТLЕ>). Конечные тэги никогда не содержат атрибутов. По своему значению тэги близки к понятию скобок "begin/end" в универсальных языках программирования, которые задают области действия имен локальных переменных и т. п. Тэги определяют область действия правил интерпретации текстовых тэгов документа.

При использовании вложенных тэгов в документе следует соблюдать особую аккуратность. Вложенные тэги нужно закрывать, начиная с самого последнего и двигаясь к первому. Некоторые НТМL-тэги не имеют конечного компонента, поскольку они являются автономными элементами. Например, тэг изображения <IMG>, который служит для вставки в документ графического изображения, конечного компонента не требует. К автономным тэгам также относятся разрыв строки (<BR>), горизонтальная линейка (<HR>) и тэги, содержащие такую информацию о документе, которая не влияет на его отображаемое содержимое, например тэги <META> и <BASE>.

В некоторых случаях конечные тэги в документе можно опускать. Большинство броузеров реализованы так, что при обработке текста документа начальный тэг воспринимается как конечный тэг предыдущего. Самый распространенный тэг такого типа - тэг абзаца <Р>. Поскольку он используется в документе очень часто, то его обычно ставят только в начале каждого абзаца. Когда один абзац заканчивается, следуюший тэг <Р> сигнализирует броузеру о том, что нужно завершить данный абзац и начать следующий. Большинство авторов тэгом конца абзаца вообще не пользуются.

Есть и другие конечные тэги, без которых броузеры отлично работают, например конечный тэг </HTML>. Тем не менее, рекомендуется включать по возможности больше конечных тэгов, чтобы избежать путаницы и ошибок при воспроизведении документа.

Общая схема построения контейнера в формате HTML может быть записана в следующем виде:

	"контейнер" := <"имя тэга" "список атрибутов"> 
			содержание контейнера 
			</"имя тэга">

Назад | Содержание | Вперед